iT邦幫忙

2024 iThome 鐵人賽

DAY 7
0
AI/ ML & Data

資料科學的小筆記系列 第 7

Day7:使用dplyr轉換資料-Manipulate Variables (2)

  • 分享至 

  • xImage
  •  

正文

接續Day6的內容~

  1. across(.cols, .fun, ..., .name = NULL):以相同方法彙總或新增多個資料欄。

先建立一個簡易資料集

df <- tibble(x_1 = c(1, 2), x_2 = c(3, 4), y = c(4, 5))

https://ithelp.ithome.com.tw/upload/images/20240818/201686079p0ZJFqg1p.png

計算每個欄位的平均值

df |> summarize(across(everything(), mean))

https://ithelp.ithome.com.tw/upload/images/20240818/20168607mqhwvdBZ8b.png

  1. c_across(.cols):計算多欄位的數值計算(針對row-wise資料)。

新增x_total欄位,其數值為將第一欄及第二欄進行總和

df |> 
  rowwise() |>
  mutate(x_total = sum(c_across(1:2)))

https://ithelp.ithome.com.tw/upload/images/20240818/20168607BNkIEAupeX.png

今天的小筆記就先到這邊,大家明天見~~

參考資料:Data transformation with dplyr :: Cheatsheet


上一篇
Day6:使用dplyr轉換資料-Manipulate Variables (1)
下一篇
Day8:使用dplyr轉換資料-Manipulate Variables (3)
系列文
資料科學的小筆記30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言